確率入門：和から積分へ：連続型確率変数の基礎

離散型確率変数から連続型確率変数への移行は、観点の画期的な転換を意味します。個々の「質量点」を足し合わせるという考えから、密度関数曲線の下にある滑らかな「面積」を測定するという考え方へと変わります。離散型変数は数え切れる結果を扱うのに対し、連続型変数は時間、距離、重さといった現実世界の無限に細かい性質をモデル化します。

核心の転換：和から積分へ

確率変数 $X$ が連続型であるとは、非負の関数 $f$ が存在し、これを 確率密度関数（PDF） として、任意の実数の集合 $B$ に対して次が成り立つことを意味します：

$P\{X \in B\} = \int_B f(x) dx$

重要な点は、任意の特定値 $a$ に対して $P(X = a) = \int_a^a f(x) dx = 0$ となることです。連続型の世界では、区間上の確率についてのみ議論できます。

PDFとCDFの共生関係

累積分布関数（CDF）$F(x)$ は、$-\infty$ から $x$ までの確率の総計を表します：

関係式

$F(x) = P\{X \le x\} = \int_{-\infty}^{x} f(t) dt$

微分

微積分学の基本定理により、密度関数は確率が蓄積される割合、すなわち変化率を表します：
$\frac{d}{dx}F(x) = f(x)$

代表値

期待値： $E[X] = \int_{-\infty}^{\infty} xf(x) dx$
中央値（$m$）： 累積分布関数が $\frac{1}{2}$ になる点、すなわち面積を二等分する点です。
最頻値： $f(x)$ が最大値を取る $x$ の値です。

和の限界

私たちの旅における「積分」の意義を理解するために、離散的世界と対比しましょう。ここでは、 レジェンドルの定理 ($\sum_{k=1}^{\infty} 1/k^2 = \pi^2/6$) または複雑な除数に関する論理（$D=k$ のとき、$k$ が $X$ と $Y$ 両方を割り切り、かつ $X/k$ と $Y/k$ が互いに素でなければならない）といったものを探すことになります。それに対して連続的世界では、分散は $Var(X) = E[(X - E[X])^2]$ として計算され、関数の期待値は $E[g(X)] = \int_{-\infty}^{\infty} g(x)f(x) dx$ によって求められます。

🎯 主な洞察

期待値は、累積分布関数（CDF）と水平線 $y=0$ および $y=1$ との間の面積としても捉えることができます。任意の確率変数 $Y$ に対して：

$E[Y] = \int_{0}^{\infty} P\{Y > y\} dy - \int_{0}^{\infty} P\{Y < -y\} dy$

問題 1

確率変数 $X$ が、$-1 < x < 1$ で $f(x) = c(1 - x^2)$、それ以外で 0 の確率密度関数（PDF）を持つとき、$c$ の値はいくらですか？

$c = 3/4$

$c = 1/2$

$c = 1$

$c = 3/2$

問題 2

同じ確率密度関数（PDF）$f(x) = \frac{3}{4}(1 - x^2)$ が $(-1, 1)$ で定義されているとき、$x \in (-1, 1)$ に対する累積分布関数（CDF）$F(x)$ は何か？

$F(x) = \frac{3}{4}(x - \frac{x^3}{3} + \frac{2}{3})$

$F(x) = \frac{3}{4}(x - \frac{x^3}{3})$

$F(x) = x^2$

$F(x) = \frac{1}{2}x + \frac{1}{2}$

問題 3

給油所の週間販売量 $X$（千ガロン単位）が、$0 < x < 1$ で $f(x) = 5(1 - x)^4$ という確率密度関数（PDF）を持つとき、在庫切れの確率が 0.01 以下になるようにするためには、タンク容量 $C$ はどれくらいでなければならないか？

$C = 1 - (0.01)^{1/5}$

$C = 0.99$

$C = (0.01)^{1/5}$

$C = 1/5$

問題 4

$f(x) = 2x$（$0 < x < 1$）であるとき、分散 $Var(X)$ はいくらか？

$1/18$

$1/9$

$1/12$

$2/3$

問題 5

平均 100 のポアソン分布の確率変数 $X$ に対して $P\{X \le 90\}$、平均 1000 のポアソン分布の確率変数 $Y$ に対して $P\{Y \le 1075\}$ を求めよ。主な教訓は何ですか？

大きな平均値の場合、正確な和を計算するのは計算的に困難です。これにより、連続型（正規）近似の導入が促されます。

ポアソン変数は実際には連続型です。

両方の確率はちょうど 0.5 です。

大きな平均値では分散がゼロになります。